package com.ocr.util;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import java.io.File;

/**
 * OCR识别文字工具类*
 * @author tianyf
 */
public class OcrUtil {

    /**
     * 语言库位置配置，可参考testfile下相关文件*
     */
    String dataPath = "C:\\testFile\\ocrImage\\tessdata-master";


    /**
     * 加入配置的工具包后识别率已经很高了，仅供娱乐使用*
     * @param imageUrl
     * @return
     */
    public String imageOcrString(String imageUrl){
        String result = "";
        final ITesseract instance = new Tesseract();
        instance.setDatapath(dataPath);
        // 简体中文库
        instance.setLanguage("chi_sim");
        // 待识别的图片路径
        File imageLocation = new File(imageUrl);
        try {
            result += instance.doOCR(imageLocation);
        } catch (TesseractException e) {
            e.printStackTrace();
        }
        return result;
    }
}
